Smart Engines: Шерлок Мультимодальная модель ИИ

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: Smart Engines (Смарт Энджинс)
Дата премьеры системы: 2025/06/20
Дата последнего релиза: 2025/10/01
Технологии: Big Data,  Data Mining,  ИБ - Система обнаружения мошенничества (фрод)

Содержание

Основные статьи:

2025

Выход на рынок Ирана и Пакистана

Российская ИИ-система «Шерлок» для распознавания и проверки документов, созданная Smart Engines, получила возможность работать с удостоверениями личности на урду и персидском языках. Это стало возможным благодаря специализированному датасету MIDV-UP, созданному учеными компании и включающему более 9000 изображений документов Пакистана и Ирана. Данный набор данных закрывает давний пробел в разнообразных и неперсонифицированных обучающих материалах и открывает «Шерлоку» выход на рынки с совокупным населением свыше 330 миллионов человек. Об этом Smart Engines сообщили 1 октября 2025 года.

На октябрь 2025 года языковые технологии искусственного интеллекта поддерживают лишь небольшую часть из более чем 7000 языков мира. Алфавиты на основе латиницы уже давно освоены системами ИИ, в то время как обучение систем распознавания языкам с другими системами письменности происходит значительно медленнее. Особенно остро проблема обстоит с урду и персидским (фарси) – государственными языками Пакистана и Ирана. Оба языка используют модифицированный арабский алфавит и отличаются сложными лигатурами.

Ранее существующие датасеты документов оставляли практически без внимания удостоверения личности на урду и персидском. Это препятствовало разработке технологий распознавания, способных работать с документами Пакистана и Ирана. Представленный Smart Engines датасет MIDV-UP изменил эту ситуацию, обеспечив разработчиков качественными данными для обучения ИИ. В состав MIDV-UP вошли 1000 уникальных образцов удостоверений нескольких типов документов – ID-карт, водительских удостоверений и свидетельств о рождении Ирана, а также ID-карт Пакистана. В общей сложности в датасете содержится 9000 полностью аннотированных изображений, полученных безопасным методом синтеза – способом создания обучающих данных без использования документов реальных людей.TAdviser Security 100: Крупнейшие ИБ-компании в России + 100 претендентов 122.3 т

MIDV-UP охватывает большой спектр сценариев предъявления документов – от сканов до фотографий и видеоклипов с естественными помехами: тенями, бликами и искаженной перспективой. Специалисты Smart Engines использовали MIDV-UP для обучения нейросетевого ансамбля «Шерлок», предназначенного для распознавания и комплексной проверки физических и цифровых документов.

«Шерлок» способен работать одновременно в видимом, ультрафиолетовом и инфракрасном диапазонах, анализировать голограммы и другие защитные элементы, осуществляя в общей сложности более 600 проверок. Это дает возможность детектировать подделки любой сложности и качества, начиная с паспортов с измененными и переклееными фотографиями и заканчивая муляжами и дипфейками. Решение было разработано при финансовой поддержке Фонда содействия инновациям.

«
Отсутствие надежных ИИ-решений долгое время оставляло неавтоматизированным огромный рынок цифровых услуг, требующих ввод данных из документов на урду и фарси. Благодаря нашему датасету эти документы больше не является преградой для «Шерлока». На октябрь 2025 года устойчивый спрос на технологии распознавания наблюдается не только в самих Пакистане и Иране, но и в России и других государствах – чему способствуют значительные миграционные и образовательные потоки. Теперь стало возможным масштабировать «Шерлока» как внутри страны, так и на международных рынках, – отметил один из авторов MIDV-UP, генеральный директор Smart Engines, д.т.н. Владимир Арлазаров.
»

Анонс мультимодальной модели ИИ "Шерлок 2o"

Специалисты российской компании Smart Engines разработали мультимодальную модель искусственного интеллекта для борьбы с поддельными документами. "Шерлок 2o" проверяет документы всех стран на подлинность по 600 параметрам и детектирует сложные подделки в любых каналах обслуживания. Принятые решения модель объясняет понятным для пользователя языком, сообщили представители Smart Engines 20 июня 2025 года.

Как они ответили, мультимодальные модели представляют собой самый прогрессивный класс нейросетевых архитектур, способных одновременно обрабатывать разные типы входных данных – текст, изображения, аудио, видео. На быстрорастущем рынке мультимодального ИИ (оценен в $1,6 млрд) Россия до недавнего времени была представлена преимущественно разработками на базе больших языковых моделей.

Исследователи Smart Engines совершили прорыв, представив технологию в области мультимодальной форензики. "Шерлок 2o" способен одновременно работать с изображениями документов из оптического, ультрафиолетового и инфракрасного спектров, видео-последовательностями с документом, текстовыми полями, данными с бесконтактной RFID-микросхемы, штрих-кодами, метаданными и сигнатурами. Даже если часть информации отсутствует, "Шерлок 2o" сохраняет высокую точность детекции подделки.

При этом модель воспринимает документ не как набор разрозненных данных, а как единую взаимосвязанную систему. "Шерлок 2o" анализирует не только все страницы и элементы по отдельности, но и логические связи между ними. Модель выявляет даже скрытые несоответствия – например, нарушения в нумерации страниц, различия в микрошрифтах или неочевидные расхождения между данными RFID-чипа и визуальной информацией.

Комплексный подход позволяет выявлять сложные подделки, где могут быть заменены отдельные страницы или переклеена фотография, нарушена последовательность элементов защиты или присутствуют микроскопические расхождения в оформлении. ИИ также детектирует подделки, созданные с применением дипфейк-технологий.

Соответствие закону обеспечивается как на этапе обучения ИИ, так и во время работы системы у клиента. "Шерлок 2o" работает в контуре у заказчика без использования GPU, при этом документы и данные ни в каком не передаются на обработку в сторонние сервисы, облачным верификаторам, на краудсорсинговые платформы.

«
«Сегодня во всем мире наблюдается тренд на разработку мультимодальных продуктов. Однако в отличие от уже известных систем, базирующихся на больших языковых моделях, технология Smart Engines использует возможности мультимодального ИИ для решения важнейшей прикладной задачи – защиты от мошеннических атак. Система может использоваться в любых сценариях, требующих предоставления документов – в банках, МФО, страховых компаниях, госсекторе», – отметил генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров.
»

Смотрите также



ПРОЕКТЫ (1) ИНТЕГРАТОРЫ (1) СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Loginom Company (Аналитические технологии) (128)
  БизнесАвтоматика НПЦ (123)
  Инфосистемы Джет (13)
  Сбербанк (12)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (11)
  Другие (760)

  БизнесАвтоматика НПЦ (4)
  Департамент информационных технологий Москвы (ДИТ) (2)
  Napoleon IT (Наполеон Айти) (2)
  Инфосистемы Джет (2)
  PIX Robotics (Пикс Роботикс) (2)
  Другие (60)

  БизнесАвтоматика НПЦ (6)
  Сбер Бизнес Софт (3)
  SL Soft (СЛ Софт) (3)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (2)
  Синимекс (Cinimex) (2)
  Другие (67)

  БизнесАвтоматика НПЦ (7)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (4)
  Loginom Company (Аналитические технологии) (3)
  Цифровые технологии и платформы (ЦТиП) (3)
  Ростелеком (3)
  Другие (95)

  Т1 (1)
  Ростелеком Центр (ЦентрТелеком) Макрорегиональный филиал (1)
  Другие (2)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Loginom Company (Аналитические технологии) (2, 240)
  БизнесАвтоматика НПЦ (2, 122)
  Полиматика (Polymatica) (4, 15)
  SL Soft (СЛ Софт) (4, 15)
  Oracle (12, 14)
  Другие (411, 208)

  БизнесАвтоматика НПЦ (1, 4)
  Сбербанк (3, 3)
  Sitronics KT, Ситроникс КТ (ранее Кронштадт Технологии) (2, 2)
  SL Soft (СЛ Софт) (1, 2)
  Полиматика (Polymatica) (1, 2)
  Другие (17, 20)

  БизнесАвтоматика НПЦ (1, 5)
  Полиматика (Polymatica) (3, 4)
  SL Soft (СЛ Софт) (3, 4)
  Rubbles (Раблз) (1, 2)
  Retail Rocket (Ритейл Рокет) (1, 2)
  Другие (16, 16)

  БизнесАвтоматика НПЦ (1, 7)
  Loginom Company (Аналитические технологии) (1, 4)
  Retail Rocket (Ритейл Рокет) (1, 1)
  Smart Engines (Смарт Энджинс) (1, 1)
  Инферит ИТМен (iTMan) (1, 1)
  Другие (13, 13)

Данные не найдены

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Deductor - 226
  Visary BI Платформа бизнес-аналитики - 122
  Loginom - 14
  Polymatica Analytics Аналитическая платформа - 13
  IBM SPSS Decision Management - 10
  Другие 192

  Visary BI Платформа бизнес-аналитики - 4
  CM.Expert Data Mining платформа - 2
  PIX Process Management (PIX Процессы) - 2
  ЦРТ: Speech Analytics Lab - 2
  Polymatica Analytics Аналитическая платформа - 2
  Другие 16

  Visary BI Платформа бизнес-аналитики - 5
  Rubbles Customer Insight - 2
  Retail Rocket: Smart Placement Ads - 2
  Polymatica Analytics Аналитическая платформа - 2
  Polymatica ML - 1
  Другие 10

  Visary BI Платформа бизнес-аналитики - 7
  Loginom - 4
  Retail Rocket: Smart Placement Ads - 1
  DLBI: Data Leakage & Breach Intelligence - 1
  Smart Engines: Шерлок Мультимодальная модель ИИ - 1
  Другие 12
Данные не найдены

Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  БизнесАвтоматика НПЦ (123)
  Большая Тройка (46)
  Сбербанк (16)
  Умная Логистика (14)
  Доверенная среда (13)
  Другие (608)

  БизнесАвтоматика НПЦ (4)
  РИР (Росатом Инфраструктурные решения) (3)
  CM.Expert (АвтоЭксперт) (2)
  Сбер Бизнес Софт (2)
  Департамент информационных технологий Москвы (ДИТ) (2)
  Другие (60)

  БизнесАвтоматика НПЦ (6)
  Сбер Бизнес Софт (3)
  Университет Иннополис (2)
  TData (ТДата) (2)
  Наносемантика (Nanosemantics Lab) (2)
  Другие (75)

  БизнесАвтоматика НПЦ (7)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (6)
  Цифровые технологии и платформы (ЦТиП) (3)
  Ростелеком (3)
  Цифра (2)
  Другие (94)

  Ростелеком Центр (ЦентрТелеком) Макрорегиональный филиал (1)
  Т1 (1)
  Другие (2)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  БизнесАвтоматика НПЦ (3, 122)
  Большая Тройка (2, 46)
  Умная Логистика (2, 14)
  Триафлай (1, 13)
  Цифра (2, 12)
  Другие (320, 168)

  РИР (Росатом Инфраструктурные решения) (3, 4)
  БизнесАвтоматика НПЦ (1, 4)
  Сбербанк (2, 2)
  DataCatalog (ДатаКаталог) (1, 2)
  Цифра (1, 2)
  Другие (17, 18)

  БизнесАвтоматика НПЦ (1, 5)
  Сбербанк (3, 3)
  DataCatalog (ДатаКаталог) (1, 3)
  Luxms (1, 3)
  Retail Rocket (Ритейл Рокет) (1, 2)
  Другие (19, 22)

  БизнесАвтоматика НПЦ (1, 7)
  РИР (Росатом Инфраструктурные решения) (2, 2)
  DataCatalog (ДатаКаталог) (1, 2)
  Luxms (1, 2)
  Data Sapience (Дата Сапиенс) (1, 2)
  Другие (11, 12)

Данные не найдены

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Visary BI Платформа бизнес-аналитики - 122
  Большая Тройка: АИС Редактор территориальных схем - 39
  Триафлай BI-платформа - 13
  ZIIoT Платформа для работы с промышленными данными - 12
  Luxms BI - 11
  Другие 161

  Visary BI Платформа бизнес-аналитики - 4
  ZIIoT Платформа для работы с промышленными данными - 2
  CM.Expert Data Mining платформа - 2
  Росатом Цифровое теплоснабжение - 2
  Arenadata Catalog - 2
  Другие 17

  Visary BI Платформа бизнес-аналитики - 5
  Luxms BI - 3
  Arenadata Catalog - 3
  Retail Rocket: Smart Placement Ads - 2
  ZIIoT Платформа для работы с промышленными данными - 2
  Другие 16

  Visary BI Платформа бизнес-аналитики - 7
  Arenadata Catalog - 2
  ZIIoT Платформа для работы с промышленными данными - 2
  Luxms BI - 2
  Data Ocean Nova Платформа данных - 2
  Другие 11
Данные не найдены